In Werbevideos und auf Messen demonstrieren Roboter heute bereits beeindruckende Fähigkeiten – vom geschickten Haushaltshelfer bis zum feinfühligen Industrieroboter. Doch bis Maschinen ihre Umgebung tatsächlich verstehen und sich sicher in realen Alltagssituationen bewegen können, ist es noch ein weiter Weg. Diesen sollen neue Software- und Infrastrukturansätze ebnen, die große Mengen dezentral gesammelter Daten zusammenführen, um sogenannte Vision-Language-Action-Modelle (VLA) zu trainieren.
